iT邦幫忙

2024 iThome 鐵人賽

DAY 27
0
AI/ ML & Data

Web仔從數學角度學習 AI/ ML & Data系列 第 27

Day 27 - Web仔從數學角度學習 自生成模型 ARGM

  • 分享至 

  • xImage
  •  

註:本文同步更新在Notion!(數學公式會比較好閱讀)

自生成模型(Autoregressive Generative Model, ARGM) 是一類重要的生成模型,旨在利用數據的過去資訊來生成未來數據點。

自生成模型的核心概念是,序列中的每個數據點都依賴於之前的數據點。給定一個序列https://ithelp.ithome.com.tw/upload/images/20241009/20168898QdCD636Lad.png ,該序列的概率可以被分解為條件概率的乘積:

https://ithelp.ithome.com.tw/upload/images/20241009/20168898etgUylPe1Q.png

這種條件概率分解形式允許我們在生成一個新數據點時,基於過去的數據點來進行生成,從而產生一個有意義的序列。

1. 模型結構

自生成模型的結構可以是非常靈活的,最常見的有以下幾種:

  1. 線性自生成模型(Linear Autoregressive Models):基於線性假設,當前的數據點是過去數據點的線性組合,類似於自回歸模型(AR 模型)。
    https://ithelp.ithome.com.tw/upload/images/20241009/20168898QCe2t9kqoc.png

  2. 神經網路自生成模型(Neural Autoregressive Models):這類模型利用深度神經網路的強大學習能力,通過神經網路來捕捉數據中的非線性關係。典型的模型包括:

    • NADE (Neural Autoregressive Distribution Estimator):使用神經網路來估計條件概率分佈。
    • PixelCNNPixelRNN:這兩個模型是圖像生成中的經典應用,通過行列式順序生成像素值。
  3. 基於序列的自生成模型:如LSTM或GRU等遞迴神經網路,它們可以處理長距離依賴性,在生成長序列時非常有效。

2. 生成過程

自生成模型的生成過程是基於隨機過程的,每一步都是根據前一步生成的結果進行計算。具體步驟如下:

  1. 初始化:模型首先需要一個起始點(通常是隨機選取),例如序列的第一個數據點https://ithelp.ithome.com.tw/upload/images/20241009/201688982ggc0LUmk9.png

  2. 逐步生成:接著基於條件概率生成序列中的後續數據點:

    https://ithelp.ithome.com.tw/upload/images/20241009/20168898auyaRPYZJ2.png

  3. 終止條件:生成過程可以按照固定長度終止,或者根據模型設計的一個停止符號來結束生成

3. 損失函數與訓練

自生成模型通常利用最大似然估計(Maximum Likelihood Estimation, MLE)來進行訓練。具體來說,模型會最小化負對數似然(Negative Log-Likelihood, NLL),即:

https://ithelp.ithome.com.tw/upload/images/20241009/201688984D1xxMYful.png

這個損失函數會指導模型學習每一步的條件概率分佈,從而提高生成的準確性。

4. 自生成模型的問題

  1. 長距離依賴性:當序列變長時,模型需要考慮到更遠的上下文信息,這可能會導致梯度消失或爆炸問題。
  2. 生成速度:由於生成是逐步進行的,對於一些應用來說,生成速度可能會較慢,尤其是在處理高維數據時。

上一篇
Day 26 - Web仔從數學角度學習 自回歸模型
下一篇
Day 28 - Web仔從數學角度學習 神經圖靈機NTM
系列文
Web仔從數學角度學習 AI/ ML & Data30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言